SPSS 快速概览：统计函数

本教程将引导你了解 SPSS 的主要统计函数。它们主要与 COMPUTE 和 IF 命令一起使用。请注意，这些都是被试内 (within-subjects) (或“水平”) 函数。

对于被试间 (between-subjects) (或“垂直”) 函数，请参阅 AGGREGATE 命令。

本教程中的所有示例都使用 hospital.sav 数据集，该数据集可免费下载。

SPSS 被试内与被试间函数被试内与被试间函数。

SPSS 统计函数 - 缺失值 (Missing Values)

SPSS 统计函数仅在其所有输入值均为缺失值 (missing values) 时，返回系统缺失值 (system missing values)。如果单个输入值为有效值，则输出值也将为有效值。这适用于本教程中我们将介绍的所有函数。

请记住，SPSS数值函数 (numeric functions) 的情况则相反：后者仅在其所有输入值都有效时才返回有效值。

SPSS 统计函数 - 点运算符 (Dot Operator)

可以为统计函数指定最少数量的有效输入值。这可以通过在函数后附加一个句点，后跟所需的有效值数量来完成。例如，compute mean_v = mean.3(v1 to v5). 表示 “仅为 v1 到 v5 上至少有 3 个有效值的个案计算 mean_v。有效值少于 3 个的个案必须在 mean_v 上获得系统缺失值。”

点运算符可以与本教程中涵盖的所有函数一起使用。不要忽视它。尽管它在 SPSS 用户中鲜为人知，但它是一项出色的省时功能。

SPSS 由于点运算符导致的系统缺失仅为在输入变量上具有至少 3 个有效值的个案计算均值。

数据准备 (Data Preparation)

我们将仅使用数据中的最后 5 个变量。严格来说，不允许对此类定序变量进行计算。但是，请参阅等距假设 (Assumption of Equal Intervals)。如果我们未能指定用户缺失值 (user missing values)，我们在它们上演示的函数可能会返回不正确的值。因此，我们将通过使用以下语法 (syntax) 运行 FREQUENCIES 来进行快速检查。请注意步骤 5 中的 TO 关键字。

***1. 指定数据所在的文件夹。
**
cd 'd:/temp'.

***2. 打开数据文件。
**
get file 'hospital.sav'.

***3. 在输出中显示值和值标签。
**
set tnumbers both.

***4. 检查频率。
**
frequencies doctor_rating to facilities_rating.

***5. 为所有涉及的变量指定 6 作为用户缺失值。
**
missing values doctor_rating to facilities_rating(6).

SPSS MEAN 函数

SPSS MEAN 函数返回变量的均值。如果存在缺失值，则有效值的总和除以有效值的数量。下面的语法显示了如何计算被试内均值。

***计算 mean_rating 作为所有 5 个评分的均值。
**
compute mean_rating = mean(doctor_rating to facilities_rating).
exe.

SPSS SUM 函数

SPSS SUM 函数返回多个变量的总和。在存在缺失值的情况下，返回所有有效值的总和。请记住，在这种情况下，结果可能有些误导。另请参阅 SPSS Sum - 警示说明 (SPSS Sum - Cautionary Note)。下面的语法计算我们的评分变量的被试内总和。

***计算 5 个评分的总和。
**
compute sum_rating = sum(doctor_rating to facilities_rating).
exe.

SPSS MIN 函数

SPSS MIN 函数返回多个值的最小值（最小的值）。我们通常将 MIN 用于数值变量 (numeric variables)，但从技术上讲，它也可以用于字符串变量 (string variables)。下面的语法在我们的评分变量上演示了它。

***计算变量的最小值。
**
compute min_rating = min(doctor_rating to facilities_rating).
exe.

SPSS MAX 函数

SPSS MAX 函数返回多个值的最大值（最大的值）。就像 MIN 一样，它也可以用于字符串变量。下面的语法计算评分变量的最大值。

***计算最大评分。
**
compute max_rating = max(doctor_rating to facilities_rating).
exe.

SPSS SD 函数

SPSS SD 函数返回多个变量的标准差 (standard deviation)。请记住，我们这里指的是被试内标准差。 SPSS 在计算标准差时除以 (n-1)。

计算被试内标准差在调查研究中非常有用，可用于检测答题一致者 (straightliners)：对所有问题给出相同答案的受访者在这些问题上的标准差将为零。这可能表明问题没有得到认真回答，在这种情况下，你可能希望将此类个案从分析中排除。请参阅 SELECT IF 和 FILTER 以获取最可能的选项。

SPSS SD 函数语法示例

***1. 计算评分变量的被试内标准差。
**
compute sd_rating = sd(doctor_rating to facilities_rating).
exe.

***2. 将答题一致者移动到文件顶部。
**
sort cases by sd_rating.

***3. 从数据中删除答题一致者。
**
select if sd_rating > 0.
exe.

SPSS 被试内标准差用于检测答题一致者使用 SPSS SD 函数检测潜在的答题一致者。

SPSS VARIANCE 函数

SPSS VARIANCE 函数计算多个变量的被试内方差 (variance)。它只是标准差的平方。

***计算评分变量的被试内方差。
**
compute variance_rating = variance(doctor_rating to facilities_rating).
exe.

SPSS MEDIAN 函数

最后，SPSS MEDIAN 函数返回多个值的中位数 (median)。同样，请注意我们指的是被试内中位数。下面的语法在我们的评分变量上演示了它。

***计算评分变量的被试内中位数。
**
compute median_rating = median(doctor_rating to facilities_rating).
exe.